查看原文
其他

中文文本数据逻辑性分析库

刘焕勇 大邓和他的Python 2022-07-09

项目作者:刘焕勇


项目地址: 

https://github.com/liuhuanyong/ComplexEventExtraction


项目介绍




原始项目名为ComplexEventExtraction,即中文复合事件抽取,包括条件事件、因果事件、顺承事件、反转事件。个人觉得可以用于识别文本中是否存在逻辑表达,统计文本中的各种逻辑表达的句子数。
事件类型



项目地址https://github.com/liuhuanyong/ComplexEventExtraction 项目介绍很详细,感兴趣的一定要去原项目看一下。

如果我会知识图谱(比如社交网络分析)可视化技能,就能根据分析出的条件、因果、顺承、反转的数据结构,可视化一段文本的知识图谱。图片是刘焕勇别的项目绘制出来的。
1、反转事件图谱

2、条件事件图谱


安装方法



项目地址
https://github.com/liuhuanyong/ComplexEventExtraction 
项目介绍很详细,感兴趣的一定要去原项目看一下。

^_^这是大邓封装的库,可以命令行安装
pip3 install https://github.com/thunderhit/eventextraction/archive/master.zip


使用




3.1 主函数
  1. from eventextraction import EventsExtraction


  2. extractor = EventsExtraction()

  3. content = '虽然你做了坏事,但我觉得你是好人。一旦时机成熟,就坚决推行'

  4. datas = extractor.extract_main(content)

  5. print(datas)

运行结果

  1. [{'sent': '虽然你做了坏事,但我觉得你是好人', 'type': 'but', 'tuples': {'pre_wd': '虽然', 'pre_part': '你做了坏事,', 'post_wd': '但', 'post_part ': '我觉得你是好人'}},

  2. {'sent': '一旦时机成熟,就坚决推行', 'type': 'condition', 'tuples': {'pre_wd': '一旦', 'pre_part': '时机成熟,', 'post_wd': '就', 'post_part ': '坚决推行'}}]


3.2  统计

  1. from eventextraction import EventsExtraction


  2. extractor = EventsExtraction()

  3. content = '虽然你做了坏事,但我觉得你是好人。一旦时机成熟,就坚决推行'

  4. datas = extractor.extract_main(content)

  5. print(extractor.stats(datas))

运行结果

  1. {'but': 1, 'condition': 1, 'seq': 0, 'more': 0, 'other': 0}


近期文章




Python核心技术与实战

Python全栈-60天精通之路

Python网络爬虫与文本数据分析

Python数据分析相关学习资源汇总帖

漂亮~pandas可以无缝衔接Bokeh

综述:文本分析在市场营销研究中的应用

Lazy Prices公司年报内容变动碰上股价偷懒

用python帮你生产指定内容的word文档

2020年B站跨年晚会弹幕内容分析

YelpDaset: 酒店管理类数据集10+G

NRC词语情绪词典和词语色彩词典

Loughran&McDonald金融文本情感分析库

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存